전 처 리 의 고 속 화 에 기반한 문자 인식 시스템 


바이 
공 용 해 


요 약 


다 량 의 문 자 가 온 라 인 으로 실시간 입 력 되는 문 자 인 식 시 스 템 에서는 영 상 의 전 처 리 가 매우 신 속 하게 이루어 
져야 한다. 또한 크 기 가 작 거 나 잡 음 을 포 함 하는 문자 영 상 에 대한 기하학적 정 규 화 나 세 선화 등 의 영상 
변 환 은 원 영 상 의 정보 유 실 이나 왜 곡 을 유 발 하므로 최 소 화 되어야 한다. 이에 따라 본 연 구 는 원 영 상 을 변 환 하 
지 않은 상 태 에서 신 속 하게 인 식 에 효과적인 특 징 을 구 하 고 자 하였다. 이를 위해 인 식 의 판 점 에서 의 미 를 
가지는 윤 각 화 소 를 정 의 하고, 다양한 영 상 의 변 화 를 수 용 하는 효과적인 특 징 을 윤 곽 화 소 로 부터 구 하 였다. 
필기체 자 모 음 과 자동차 번호판 숫자 인식 실험 결과, 제 안 된 방 법 이 기 존 의 방 법 보다 인 식 에 보다 효 과 적 이었 
으며 한 번 의 영상 주 사 로 전 처 리 를 완 료 하 므로 소요 시 간 을 크게 줄일 수 있었다. 
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1. 서 론 


멀티미디어 응용 분야 중에서 시각 정 보 의 자동화 
처 리 는 그 실질적 필 요 성 이 매우 크다 할 수 있으며, 
특히 인 쇄 되거나 필 기 된 문서 정 보 의 오프라인 문자 
인 식 시 스 템 은 문 서 인식, 전 표 인식, 우 편 번 호 인식, 차 
량 번 호 인식 등 그 요구 분 야 가 광 범 위 하고 실 용 성 이 
크 므 로 지 속 적 으로 연 구 되고 있 다 [123]. 문 자 인식 
시 스 템 은 문자 자 체 의 형태 변 화 뿐만 아니라 크기, 


이 논 문 은 1997 년 한 국 학 술 진 홍 재 단 의 공 모 과제 연 구 비 에 
의하여 연 구 되었음. 


” 순 천 향 대 학교 컴 퓨 터 학부 부교수 


위치 등 의 기하학적 변 화 와 다양한 획 폭 의 변 화 를 
수 용 할 수 있도록 설 계 되 어야 한 다 [4]. 문자 영 상 의 
획 의 폭 을 일 정 하 게 하는 방 법 으로 세 선 화 (010 ㅁ 00148) 
알 고 리 즘 이 많이 이 용 되고 있으나, 세 선 화 는 잡 음 이 
나 세부 형 태 의 변 화 에 민 감 하므로 세 선화 후의 골격 
(6 리 600) 이 문자 영 상 의 원래 형 태 를 적절히 유지 
하지 못할 수 있 다 [5.61. 산업 현 장 에서 취 득 되는 문 
자 영 상 은 크 기 가 작고 잡 음 을 포 함 하는 경 우 가 많으 
므로 문자 영 상 에 대한 기하학적 정 규 화 나 세 선 화 
등 의 영상 변 환 은 원 영 상이 왜 곡 되 어 인 식 에 부정적 
인 효 과 를 유발할 수 있다. 따라서 원 영 상 을 변 환 하 
지 않은 상 태 에서 인 식 에 유리한 효과적인 특 징 을 
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구하는 것이 바 람 직 하다. 

대 부 분 의 문 자 인 식 시 스 템 은 문자 영 상 의 전처리 
와 신 경 희 로 망 의 학 습 으 로 구 분 될 수 있다. 신 경 회로 
망 의 학 습 은 고 속 의 컴 퓨 터 나 분산, 병렬 컴퓨팅 환 
경 에서 비교적 오랜 시간 오 프 라 인 으로 이루어질 수 
있으며, 최종 학 습 된 상 태 만 을 비교적 저 속 인 일반 
컴 퓨 터 에 이 식 시킬 수 있다. 그러나 인 식 에 펼 요한 
제반 문자 영 상 의 전 처 리 는 다 량 의 데 이 터 를 제한된 
시간 내에 처 리 해 야 하므로 매우 신 속 하게 이루어져 
야 한다. 

본 연 구 는 오프라인 문 자 인 식 시 스 템 의 구 현 에 있 
어 다 음 의 두 가지 사 항 을 고 려 하 였다. 첫째, 인 식 을 


위한 신 경 회 로 망 의 학 습 에는 상 대 적 으로 시간적 제 、 


약 을 크게 두지 않은 반 면 에 인 식 에 필요한 제반 전 
처리 과 정 을 신 속 하 게 수 행 하고자 하였다. 둘째, 원 
영 상 에 포 함 된 모든 정 보 를 인 식 에 최대한 이 용 하 기 
위하여, 크기, 위 치 의 정 규 화 나 세 선화 목 적 으로 영 
상 을 변 환 시키지 않고 인 식 에 적합한 특 징 을 원 영 상 
에서 직접 구 하 고 자 하였다. 이를 위하여 인식 측면 
에서 의 미 를 가지는 윤 곽 화 소 를 선 택 하여 방향 특징 
을 구 하 였으며, 문자 영 상 의 위치, 크기, 획 의 폭 변화 
를 수 용 하기 위하여 윤 곽 에서 추 출 된 방향 성 분 을 
영상 축 에 투 영 한 비 례 값 을 사 용 하였다. 전 처 리 에 소 
요 되는 시 간 을 줄 이 고 자 상 기 의 과 정 을 한 번의 영상 
주 사 (6030) 로 이 루 어 지 도 록 하였다. 제 안 된 방 법 이 
인 식 에 효 과 적 인 지 실 험 하기 위하여, 필기체 자 모 음 
인 식 과 자동차 번호판 숫자 인 식 을 실 험 하였다. 또한 
비교 실 험 으로서 크 기 와 위치 정규화, 세 선 화 를 모두 
수 행 하 는 특징 추출 방 법 과 정규화 센 트 랄 모 우 먼 트 
(001770811260 0600 ㅠ 8100070601) 방 법 을 동일 문자 집단 
에 적 용 하여 인 식 률 과 인 석 에 소 요 되 는 시 간 을 비교 
하였다. 신 경 회 로 망 의 학 습 에 있어서는 유전자 알고 
리 즘 을 신 경 회 로 망 의 가중치 초기화 과 정 에 사 용 하 
여 수렴 효 과 를 조 사 하 였 다 [7]. 


2. 문자 영 상 의 정규화, 특징 추출 


스 캐 너 나 카메라 등에 의해 문자 영 상 이 취 득 되면 
먼저 잡음 제 거 와 이진화 후에 인 식 에 적합한 특 징 을 
추 출 하 게 된다. 문자 영 상 은 문자 자 체 가 가지는 다 
양한 형태 변 화 뿐만 아니라 크기, 위치, 회 전 에 의한 
기하학적 변 화 를 포 함 하 므로, 기하학적 변 화 를 특 


위 치 나 규 모 로 획 일 화 시키는 과 정 이 인 식 에 앞서 선 
행 된다. 문자 영 상 의 기하학적 변 화 가 보 정 된 이 후 에 
문 자 의 형 태 를 효과적으로 대 표 하는 특 징 을 구한다. 
간 단 하면서도 많이 사 용 되 는 문자 영 상 의 특 징 으로 
망 특 징 이 사 용 된다. 망 특 징 은 문자 영 상 을 그림 
168) 와 같이 일정 등분 구 간 으로 나누어 구간 내의 
영상 화 소 수 를 누 계 한 특 징 을 사 용 한 다. 큰 특징 벡 
터는 패 턴 분 류 기 의 입 력 에 부 적 절 하므로 문자 영상 
의 전 역 적인 형 태 를 작은 특징 벡 터 로 나 타 내 고 자 
할 경우 망 특 징 이 유 리 하다. 그림 100) 와 그림 1(0) 에 
서 보 이 듯 이 문자 영 상 을 수평 방 향 과 수직 방 향 으로 
일정 간 격 으로 주 사 하면서 영 상 과 배 경 이 교 차 하는 
수 를 세는 교 차 점 수 특 징 과 교 차 하는 거 리 를 이용하 
는 교 차 거리 특 징 은 적절히 정 규 화 된 경우 효 과 적 일 
수 있다. 그러나 망 , 교 차 점 수, 교 차 거리 특 징 은 문자 
영 상 의 크기, 위치, 회 전 의 변 화 에 매우 민 감 할 뿐만 
아니라 잡 음 이 더해진 경 우 에는 사용 시 제 약 이 따른 
다메. 


(6) 교 차 점 수 특징 (0) 교 차 거리 특징 


(3) 망 특징 


그림 1. 망 , 교 차 점 수, 교 차 거리 특징 


문자 영 상 의 경우 영상 내의 획 성 분 의 방 향 과 크 
기 의 조 합 이 문자 형 태 를 특징 한다고 볼 수 있다. 
획 의 방향 성 분 을 알 아 내기 위해 보 편 적 으로 마스크 
연 산 자 를 사 용 한 다. 마스크 연 산 자 로는 50681 마스 
크 , 4 방 향 마 스 크 (그림 2), 6\1 마스크, 4801 마 
스 크 (그림 3) 등 이 있다. 이러한 방향 마스크 연산 
결 과 는 상 기 한 압축 특 징 과 함께 사 용 되 기도 한다 
[9]. 이 외에 기 하 학 적 인 영 상 에 논리 연 산 을 가하는 
모 폴 로 지를 이용하는 방 법 과 영 상 을 수 평 축 과 수직 


이 이 이 이 니 이 이 이 니 니 이이 
니 티 니 이 니 이 이 니 이 이 니 이 
나비 다 이 파 히 이 [00 1| 
수평 방향 수직 방향 사선 방향 역 사 선 방향 


그림 2. 방향 마스크 


사선 방향 


그림 3. 150 마스크 


역 사 선 방향 


축 에 투 영 한 결 과 를 이용하는 방 법 도 사용되고 있다 
[010]. 

이상 열 거 한 방 법 들은 자 체 적 으로 기 하 학 적 인 변 
화 를 수 용 하지 못 하 므로 크기, 위치, 회전 변 화 를 보 
상하는 전처리 과 정 을 필 요 로 한다. 영 상 의 기하학적 
변 화 의 일 부 나 모 두 를 수 용 하는 특 징 으로 허 프 변환 
01049 ㅁ ㅠ 8051074), 로그 폴라 변 환 108 ㅁ 01& 
ㅠ 8051000), 퓨 리 어 디 스 크 립 터 ((00406『 0680040601 ㅁ ), 
모 우 먼트 인 베 어 리 언 트 (01010161[ 107811800) 동이 사 
용 될 수 있다. 이러한 방 법 들 은 양자화 오 류 와 샘플 
링 오 류 에 의해 이 진 화 된 작은 문자 영 상 에 적 용 하는 
데 있어서 제 한 점 으로 작용할 수 있 다 [111. 

문자 영 상 은 획 (600[6) 의 두 께 가 일 정 하 지 않는 
데 이러한 현 상 은 문자 영 상 이 인 쇄 체 이거나 필기체 
이거나 관 계 없어 발 생 한 다 . 인 쇄 체 인 경우 폰 트 나 프 
린 터 에 따라 다양한 획 의 폭 이 출 력 된다. 필 기 체 인 
경우 필기 스 타 일 이나 필 기 구 의 특 성 에 따라 역시 
다양한 획 의 폭 이 결 과 된 다. 뿐만 아니라 입력 시점 
에 서 의 입력 장치, 조 명 등 의 환 경 과 이진화 시 의 이 
진화 임 계 값 (0 ㅠ 650010) 도 문자 영 상 의 획 의 폭 변화 
에 지대한 영 향 을 준다. 결 과 적 으로 문자 영 상 은 매 
우 다양한 폭 을 가지는 획 으로 구 성 된 다고 할 수 있 
으며 획 의 폭 에 무 관 한 특징 추 출 은 인 식 에 있어 중 
요 하 다. 대부분 획 폭 의 불 규 칙 성 을 최 소 화 하 기 위해 
세 선 화 알 고 리 즘 을 사 용 하는데 세 선 화 란 두 께 를 가 
진 확 의 바 깥 쪽 부터 화 소 를 하나씩 제 거 해 서 획 의 
폭 을 연 결 성 을 유 지 하 는 최소 폭 인 하 나 의 화 소 로 
만드는 과 정 이다. 세 선 화 된 문자 영 상 은 모두 한 화 
소의 폭 을 가지는 획 으로 구 성 되어 문자 형 태 를 유지 
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하는 골 격 (966600) 으 로 표 현 되 게 된다. 그림 4(@) 에 
이 진 화 된 숫자 영상 샘 플 을 보였고, 그림 406) 에 
240808 과 5060 의 알 고 리 즘 을 이용한 세 선화 결 과 를 
보 였 다 [12]. 그림 4(3) 와 같이 잡 옴 이 적은 영 상 인 경 
우 세 선 화 된 골 격 은 문자 영 상 의 형 태 를 적절히 유지 
하면서 획 의 폭 을 일 정 하 게 해 줌 을 알 수 있다. 


(06) 세 선 화 된 골격 


그림 4. 잡 음 이 적은 문자 영 상 의 세 선화 골격 


그러나 세 선 화 는 많은 시 간 을 요 구 하 는 반복 알고 
리 즘 일 뿐만 아니라, 영 상 에 잡 음 과 요 철 이 존 재 하는 
경우 결 과 되 는 골 격 이 원래 영 상 의 형 태 를 적절히 
반 영 하지 못하는 단 점 을 가진다. 특히 획 의 교차점, 
분기점, 끝점 등에서 원래 영 상 의 형 태 가 왜 곡 되는 
경 우 가 혼 하 발생할 수 있으며, 세 선 화 에 의해 변형 
된 골 격 과 파 생 되 는 잔 가 지 를 가지는 영 상 은 인식 
시 오 류 를 증 가 시키는 요 인 으로 작 용 한 다. 실제 응용 
분 야 에서 취 득 되 는 영 상 은 윤 곽 선 부 근 에 다 량 의 잡 
음 을 포 함 할 수 있다. 세 선화 알 고 리 즘 은 윤 곽 선의 
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요 철 이 영 상 의 일 부 인 지 잡 음 인 지를 분 간 하 기 어려 
우 므 로, 세 선화 적용 후의 영 상 에는 요철 부 분 에 잔 
가 지 가 형 성 되 거나 원래 영 상 의 끝 점 이 유 실 되는 등 
의 영상 왜 곡 이 일어난다. 이는 근 본 적 으로 획 과 요 
철 의 구 분 이 경 험 적 이고 전 역 적인 판 단 에 근 거 하 므 
로, 지역적 연 산 에 의 존 해 아 하 는 세 선 화 알고리즘 자 
체가 가지는 문 제 라 고 할 수 있다. 21208 과 50460 의 
알 고 리 즘 을 비롯해 현재 사용되고 있는 세 선화 알고 
리 즘 은 이러한 문 제 점 을 어느 정도 완 화 시킨 것은 
사 실 이나 근 본 적 으로 해 결 하기에는 미 흡 하다. 세 선 
화 시 에 자주 발 생 하는 잔가지 문 제 의 적극적 해 결 을 
위해 (14 와 '7'5608 이 제안한 알 고 리 즘 은 시간적 복 
잡 도 가 높고 영 상 의 특정 규 격 을 가 정 하 는 등 일 반 성 
이 결 여 되고, 연산 시 간 이 오래 걸 리 더라도 인 간 의 
시 각 효 과 를 이용해 그레이 스케일 영 상 으로부터 직 
접 세 선 화 를 시도한 경 우 도 있 다 [1314]. 또한 10768 
의 알 고 리 즘 은 잔 가 지 가 효과적으로 감 소 하는 대신 
에 골 격 이 휘어져 나타나서 원래 형 태 를 적절히 반영 
하는데 어 려 움 이 있 다 [151. 

실제 산 업 현 장 에서 취 득 된 영상 중 윤 곽 선 부 근 에 

음 을 가지는 영 상 을 그럼 5(3) 에 보였다. 그럼 508) 
의 영 상 에 가 806 과 5460 의 세 선화 알 고 리 즘 을 적용 
했을 때 결 과 되는 골 격 을 그림 5(06) 에 보였다. 여 기 에 
서 보 여 지듯이 세 선화 알 고 리 즘 은 잡 음 에 매우 민감 
한 경 향 울 나타낸다. 잔가지 문제 해결 방 법 의 하나 
인 티 0 ㅠ 68 의 알 고 리 즘 을 그럼 5(3) 에 적용한 결 과 를 
그림 5(0) 에 보였다. 그림 5(0) 에 서 그림 506) 의 잔 가 
지가 일부 제 거 되 었 음 을 알 수 있으나, 잔 가 지 를 없 
애 는 과 정 에 서 원 영 상의 골 격 이 등 글 려 지 거나 분기 
점이 왜 곡 되 는 등 의 부 작 용 을 볼 수 있다. 그림 506) 
또는 그럼 5(0) 와 같이 왜 곡 된 골 격 을 이용해 구 해 지 
는 특 징 은 인 식 에 부정적인 영 향 을 줄 수 있다. 


3. 윤 곽 선 기반 특징 


문자 영 상 을 정 규 화 하거나 세 선 화 하는 영 상 의 변 
환 없이 원 영 상에서 직접 인 식 에 적합한 특 징 을 구할 
수 있다면, 인식 성능 면 에 서 보다 견 고 할 수 있으며 
실행 시간 면 에 서 효 율 적 일 수 있다. 이에 따라 그럼 
6(8) 에 서 와 같은 기 존 의 정 규 화 와 세 선 화 방 법 을 사 
용 하 지 않고, 그림 606) 와 같이 이 진 화 된 원 영 상에서 
직접 특 징 을 구하는 방 법 을 제 안 한 다. 


{06 


(3) 잡 음 하 많은 문자 영상 


00) 20808 희 세 선화 결과 


(6) 퍼 0065 의 세 선화 결과 
그림 5. 잡 음 이 많은 문자 영 상 의 세 선화 글 격 


잡음 | | 위치, _ 
영상 =| 제거 |=| 크기 |=| 세 선 화 |= 특징 = 인 
이력 | 이 건 화 | [정규화 추출 | 식 
(3) 기 존 의 방법 


잡음 ; 
이사 =| 제거 | ㅜ ---| 특 징 추 출 |----=3| 곰 
보려 | | 이진화 


(6) 제 안 된 방법 
그림 6. 특징 추출 방법 


이 진 화 된 문자 영 상 에서 인 식 에 적합한 형 태 적 특 
징 을 신 속 하게 구하기 위해 다 음 의 사 항 들을 고 려 하 
였다. 첫째, 문자 영 상 이 적절히 분 할 되었고 회전 변 
화가 없 음 을 가 정 하 였다. 영 상 분 할 과 회전 보 상 은 특 
징 추 출 과 직접적 연관 없이 문 서 상 에 서 의 문자열, 
구획, 종이 위치 등 의 전 역 적 정 보 를 이용하는 별도 
의 연구 분 아로 다 루 었 다. 둘째, 문자 영 상 의 크 기 와 
위치 변 화 를 수 용 하기 위한 영상 변 환 을 배 제 하 였다. 


위 치 와 크기 정 규 화 는 추가 연 산 을 필 요 로 할 뿐만 
하니라 원 영 상의 정 보 를 유 실 할 가 능 성 을 가진다. 셋 
째 , 획 의 폭 을 균 일 화 하기 위한 세 선 화 를 수 행 하 지 
않았다. 세 선 화 는 많은 시 간 을 요 하 는 반복적 작 업 이 
므로 전처리 속 도 를 저 하 시킬 뿐만 아니라, 잡 음 이 
많은 경우 세 선화 골 격 이 적 절 하게 원 영 상의 형 태 를 
유 지 하지 못할 수 있기 때 문 이 다 . 

문자 형 태 에 대한 정 보 를 획 을 지나는 중 간 선 
(20601 3×6) 인 골 격 에서 구하는 방 법 이 일 반 적 이나, 
문 자 를 이루는 획 의 윤 곽 선 정보 또한 문자 영 상 의 
형 태 를 표 현 하 는데 큰 역 할 을 한다. 따라서 제 안 된 
방 법 은 문자 영 상 으로부터 인 식 에 필요한 특 징 을 획 
의 윤곽 부 분 에 서 의 방 향 적 특 성 에서 구 하 고 자 하였 
다. 먼저 특정 화 소 가 획 의 윤곽 형 성 에 기 여 하 는 정 
도 를 나 타 내 기 위하여, 화소 인 근 에 분 포 한 배 경 화소 
(0 인 화 소 ) 와 획 화 소 (1 인 화 소 ) 의 구 성 비 를 사 용 하였 
다. 즉 , 화 소 를 중 심 으 로 하는 6 ※ 쥐 창 을 설 정 하고, 
화 소 가 윤곽 형 성 에 기 여 하는 정 도 를 띠 포지 창 내에 
서 의 배 경 화소 수 와 획 화소 수 의 비로 나 타 내 었다. 

본 논 문 에서는 획 을 구 성 하는 화소 중에서 획 의 
윤 곽 에 인 식 의 관 점 에서 의미 있게 분 포 하는 화 소 를 
윤 곽 화 소 로 정 의 하였다. 획 의 윤 곽 에 어느 정도 가까 
이 있는 획 화 소 가 인 식 에 얼 마 만큼 영 향 을 주 는 가 를 
근 사 화 (30000×14708400) 하 는 방 법 으로 획 화 소 (1 인 화 
소 ) 중에서 화 소 비 가 특정 임 계 값 ( 임 계 화 소 비 ) 을 초 
과 하 는 화 소 를 윤 곽 화 소 로 구 별 하였다. 이 경우 획 화 
소 가 인 식 에 주는 영 향 은 획 화 소 가 윤 곽 선 주 위 에 
분 포 한 정 도 를 결 정 하는 임 계 화 소 비 에 따라 변하게 
되므로, 다양한 임 계 화 소 비 를 이용한 인식 실 험 을 통 
해서 임 계 값 중에서 가장 높은 인 식 률 을 결 과 하 는 
값 을 최 적 임 계 화 소 비 로 사 용 하였다. 이렇게 구 해 지 
는 최 적 임 계 화 소 비 를 이용해 윤 곽 화 소 를 선 택 하 고 
윤 곽 화 소 만을 대 상 으로 방 향 성 분 특 징 을 구 하 였다. 

영상 격자 안에서 문자 영 상 의 위 치 와 크 기 에 대 
한 정 보 를 윤 곽 화 소 가 수 평 축 과 수 직 축 에 투 영 된 양 
으로 나 타 내 었으며, 수 평 축 과 수 직 축 에 누 적 된 투영 
값 을 이 용 하 여 영 상 이 존 재 하는 실 투영 구 간 을 설정 
하였다. 여 기 에 서 누 적 된 투 영 값 은 문자 영상 자 체 가 
투 영 된 값 이 아니라, 획 의 윤곽 성 분 이 투 영 된 값 으 
로서 윤곽 성 분 의 위 치 와 크기 정 보 를 나타낸다. 문 
자 영 상 의 작은 변 화 가 인 식 에 미치는 영 향 을 줄이기 
위해 설정된 실 투영 구 간 을 적절한 크 기 의 등 간 격 으 
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로 분 할 하였다. 

방 향 연 산 자 를 윤 곽 화 소 에 한해 선 택 적 으로 적용 
하는 것은 획 의 윤 곽 에서만 방향성 정 보 룰 추 출 함 을 
뜻 한 다. 방향 연 산 자 의 한 예 로 써 그림 7 과 같은 4 개 
의 5 ※ 5 방 향 ( 수 평 , 수직, 사선, 역 사 선 ) 마스크 연산 
자를 사용할 수 있다. 이때 사 용 되 는 방향 마 스 크 의 
크 기 는 윤곽 화 소 를 정 의 하 는데 사 용 하는 창과 같은 
크 기 일 필 요 는 없으며, 사 용 되 는 방향 마 스 크 도 다른 
형 태 의 방향 마 스 크 라 도 가 능 하 다. 그럼 7 과 같은 방 
향 마 스 크 를 윤 곽 화 소 에 적 용 하여, 획 이 가지는 지역 
적 4 방 향 성 분 을 찾을 수 있다. 임 의 의 숫자 영 상 에 
그럼 7 의 방향 연 산 자 를 적용한 결 과 를 그림 8 에 보 
였다. 

방향 마 스 크 를 윤 곽 화 소 에 선 택 적 으로 적 용 시킨 
결 과 를 개별 마 스 크 에 할 당 된 윤 곽 화 소 를 투 영 한 경 
우와 동 일 하게 수 평 축 과 수 직 축 에 투 영 하 였다. 개별 


010|0|0|0 0|10|1|0|0 
0 이 0|0|0 106|0|1|0|0 
티티 니 니니 0|0|1|0 
0 너 + 
0|10|10|0|0 0|0|1|0|0 
01010|0|0| 0|0|1|0|0 
수 평 마스크 수직 마스크 
0|0|1010|1 1 [9 0|0|0 
0|0|0|110 0|1|10|0|0 
0|10|110 | 0 01|0|1|0|0 
0|1|0|0|0 0|0|0 니 0 
+ 
1101010 이 0|0|0|0|1 
사선 마스크 역 사 선 마스크 


그림 7. 5×5 방향 마스크 


이어 


원 영 상 수평 수직 사선 
마스크 마스크 마스크 


역 사 선 
마스크 


그림 8. 5×5 방향 마스크 결과 
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마스크 결 과 가 투 영 되는 구 간 은 윤 곽 화 소 가 투 영 된 
실 투영 구 간 과 동 일 하도록 하였다. 결 과 적 으로, 윤곽 
화 소 가 투 영 된 분할 구 간 은 개별 마스크 연산 결 과 가 
투 영 된 분할 구 간 과 서로 1 : 1 사 상 된다. 이렇게 서로 
사 상 된 분할 구 간 에 존 재 하는 윤 곽 화소 투 영 값 과 방 
향 특성 투 영 값 의 비 를 해당 구 간 에 서 의 방향 성분 
특 징 으로 이 용 하 였다. 

이러한 투 영 이 수 행 되는 과 정 을 그림 9 에 보였다. 
그림 9(8) 에 원 영 상 과 원 영 상의 수 평 축 , 수 직 축 투 
분 포 를 보였다. 동일한 영 상 에 대한 윤 곽 화 소 의 투영 
값 을 그림 9(6) 에 보였다. 윤 곽 화 소 에 수평, 수직, 사 
선 , 역 사 선 마 스 크 를 적용한 영 상 과 투 영 값 을 그림 
9(6.0.6. 에 각각 보였다. 문자 영 상 의 특 징 으로 이용 
되는 비 례 값 은 그림 906) 의 윤 곽 화소 투 영 값 과 그림 
9(60.6.0 의 방향 특성 투 영 값 중에서 서로 사 상 되는 
구 간 의 비 례 값 이다. 


(8) 사 선 륜 확 


상 문 의 무얼 성 섬 분 의 투명 


(6) 수 펌 윤 짝 (1) 맥 사 선 륜 곽 


성 분 의 투영 


그림 9. 윤 곽 화 소의 방 향 성 분 투영 결과 


예 를 들어 수평, 수 직 축을 개의 등 간 격 으로 나눈 
다면, 각 마스크 연 산 은 수평, 수 직 축 에 각각 개의 
비례 값 을 생 성 하여 차원 벡 터 를 구 성 한 다. 이러한 
차원 벡 터 는 각 마 스 크 마 다 쌍 으로 만들어져, 총 8 
개의 차원 벡 터 가 구 성 된 다. 각 차원 벡 터 의 성분 
은 원 영 상의 동일 투영 구 간 에 서 윤 곽 화소 투 영 값 과 
방향 성분 투 영 값 의 비 를 뜻 하 므로, 영 상 의 위 치 와 
크기 변 화 를 수 용 함 과 동시에 획 의 두 께 에 무 관 한 
방향 성분 특 성 을 가지게 된다. 따라서 전체 8 개 의 
차원 벡 터 는 문자 영 상 의 위 치 와 크 기 의 변 화 를 수 
용 하 면서 문자 영 상 을 구 성 하는 획 의 방향 성분 모두 


를 포 함 하게 되어, 문자 영 상 의 전 역 적 특 징 을 효과 
적 으 로 나타낼 수 있게 된다. 문자 영 상 으로부터 위 
치 , 크기, 획 폭 의 변 화 를 수 용 하는 윤 곽 의 전 역 적 
방향 특 성 을 추 출 하는 단 계 를 아 래 에 요 약 하였다. 


단 계 1) 이진 영 상 을 주 사 하면서 각 화 소 에 띠 ※ 
치 창 내의 배 경 화 소 (0 인 화소) 수 와 획 화 
소 (1 인 화소) 수 의 비 를 구한다. 
단 계 2) 획 화소 중에서 임 계 화 소 비 를 초 과 하는 윤 
곽 화 소 에 한하여, 
- 윤 곽 화 소 를 수 평 축 , 수 직 축 에 투 영 한 다. 
- 윤 곽 화 소 에 대해 4 방 향 마스크 연산 결 과 를 
각 마 스 크 에 할 당 된 수 평 축 , 수 직 축 에 투 영 한 
다. 
단 계 3) 주 사 가 완 료 되면, 
- 윤 곽 화 소 가 투 영 된 수 평 축 , 수 직 축 에서 윤곽 
화 소 의 실 투 영 구 간 을 설 정 한다. 

- 윤 곽 화 소 실 투영 구 간 을 최적 등분 분 할 한 다. 
각 마 스 크 에 할 당 된 수 평 축 , 수 직 축 을 윤 곽 화 
소 가 투 영 된 수 평 축 , 수 직 축 에 1:1 사 상 한 다. 

- 사 상 된 분할 구 간 에 존 재 하는 투 영 값 의 비 를 

구한다. 
단 계 4) 단 계 3) 에 서 구한 투 영 값 의 비로 특징 벡터 
를 구 성 한 다. 


제 안 된 방 법 은 위치, 크기 정 규 화 와 세 선화 등 의 
별 도 의 전처리 과 정 을 필 요 로 하지 않을 뿐만 아니 
라 , 한 번 의 영상 주 사 로 특징 추출 과 정 이 완 료 된 다 . 
더욱이 영 상 의 배 경 과 영 상 의 내 부 에서는 마스크 연 
산이 수 행 되지 않으므로, 특징 추 출 을 위한 전처리 
과 정 에 소 요 되 는 시 간 을 크게 줄이고 인 식 의 효 율 을 
높이는 특 징 을 구할 수 있다. 


4. 실험 결과 및 분석 


제 안 된 방 법 의 인석 효 과 를 실 험 하 기 위하여 50 
※ 50 크 기 의 필기체 자음 및 모음 20,000 개 집 단 과 
30 ※× 60 크 기 의 자동차 번호판 숫자 512 개 집 단 을 
이 진 화 하 여 사 용 하였다. 윤 곽 화 소 를 정 의 하는 창의 
크 기 는 문자 영 상 의 크 기 에 따라 정 해 질 수 있으며 
본 실 험 에 서는 5 ※ 5 창 을 사 용 하였다. 방향 마스크 
로는 윤 곽 에 분 포 한 잡 음 에 덜 민 감 하 면서 전체적인 
획 의 방향 특성 추 출 에 유리한 그림 7 의 55 마스 


크 연 산 자 를 사 용 하였다. 

다양한 방 법 에 의해 구 해 지는 특 징 들 간의 인 식 성 
등 비 교 는 신 경 회 로 망 의 구 조 에 독 립 적 인 동일한 조 
건 에서 비 교 되어야 하므로, 모든 인식 실 험 에서 다음 
과 같은 동일한 인식 시 스 템 을 사 용 하였다. 하 나 의 
은 닉 충 을 가진 다 충 퍼 셉 트 론 을 사 용 하였으며, 은닉 
충 노 드 의 수 는 16 개 , 가중치 교 정 율 은 0.1 로 통 일 하 
여 학 습 에 사 용 하였다. 입 력 충 과 출 력 충 노드 수 는 
사 용 되 는 특 징 과 집 단 의 종 류 에 따라 가 변 되 며 , 학습 
에 소 요 되 는 시 간 도 이러한 조 건 에 종 속 된 다. 이에 
따라 모든 실 험 에서 신 경 회 로 망 이 충분히 수 렴 될 수 
있도록 시간적 제 약 을 완 화 하였다. 

먼저 필기체 자 모 음 문 자 의 인 석 을 실 험 하 였으며, 
이 경우 수평, 수 직 축의 실 투 영 구 간 은 3 등 분 으로 분 
할 하였다. 하 나 의 마스크 연 산 은 수 평 축 과 수 직 축 에 
각각 3 차 원 벡 터 를 결 과 하 며 , 4 방 향 마스크 연 산 으 로 
총 24 개 의 실 수 로 구 성 되 는 특징 벡 터 를 얻게 된다. 
주어진 창 에서 0 인 배 경 화소 수가 7 개 이고 1 인 획 화 
소 수가 개인 경우, 화 소 비 는 0/ ㅁ 으로 나타낼 수 
있다. 따라서 5 ※× 5 창 에서는 화 소 비 가 1/24 부 터 
12/13 까 지의 값 을 가질 수 있다. 윤 곽 화 소 를 정 의 하 
는 효과적인 임 계 화 소 비 를 결 정 하 기 위하여, 임 계 화 
소 비 를 1/24 부 터 단 계 적 으로 중 가 시키면서 인 식 성 
능 을 측 정 하 였다. 각 임 계 화 소 비 를 이용해 구 해 진 패 
턴 집 단 올 다 충 퍼 셉 트 론 으 로 동일한 시간 학 습 서 킨 
후, 인식 결 과 를 출 력 충 에서 측 정 된 인 식 오 류 율 과 평 
균 제 곱 오 류 율 로 표 1 에 보였다. 인 식 오 류 률 은 임계 
화 소 비 가 중 가 함 에 따라 감 소 하다가 다시 중 가 하는 
함수 형 태 로 나 타 났 으며, 이러한 결 과 는 획 의 윤 곽 에 
매우 근 접 하 거나 또는 획 으로부터 멀리 있는 확 화소 
는 획 의 윤곽 특 성 을 상 대 적 으로 적게 가 짐 으로서 
인 식 에 적은 영 향 을 주는데 기 인 한 다. 임 계 화 소 비 가 
3/22 일 때 가장 낮은 인 식 오 류 률 을 보 임 에 따라 최적 


표 1. 임 계 화 소 비 에 따른 인식 결 과 (%) 


임 계 화 소 비 
1724 
2723 
3/22 
4/21 
5/20 
6/19 
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임 계 화 소 비로 결 정 하였으며, 본 실 험 에서는 획 화소 
중에서 최 적 임 계 화 소 비 3/22 를 초 과 하는 화 소 에 한 
하여 방향 마스크 연 산 을 적 용 하였다. 

실 투영 구 간 의 등분 수 와 인식 성 능 의 관 계 를 알 
아 보 기 위하여, 수평, 수 직 축 실 투 영 구 간 을 2 둥 분, 
3 등 분, 4 등 분 분 할 한 각 각 의 경 우 에 대한 인식 실험 
을 수 행 하였다. 표 2 의 인식 결 과 에 의하면 ? 둥 분 분 
할인 경우 16 차 원 특징 벡 터 를 구 성 하게 되며, 인식 
성 능 이 매우 낮게 나타났다. 3 등 분과 4 등 분 분 할 인 
경우 각각 34 차 원 특징 벡 터 와 32 차 원 특징 벡 터 를 
구 성 하였다. 표 2 의 결 과 는 등분 분 할 에 비해 3 등 분 
분 할 이 크게 향상된 인 식 를 을 보이는 반 면 에, 3 등 분 
분 할 과 4 등 분 분 할 에서는 큰 차 이 를 나타내지 않음 
을 보여준다. 특히 4 등 분 분 할 의 경우 특징 벡 터 의 
크 기 가 339 이상 중 가 하여 학 습 과 인 식 에 더 많은 
시 간 을 필 요 로 하 게 되 는데 반하여 오히려 인 식 오류 
가 다소 증 가 함 을 보였다. 이로써 분할 구 간 을 더 늘 
려 도 그에 수 반 되는 인식 효 과 가 크지 않 음 을 예 상 할 
수 있으므로, 본 실 험 에서는 수평, 수 직 축의 실 투영 
구 간 을 3 등 분 분 할 하였다. 


표 2. 실 투 영 구 간 의 동 분 수 에 따른 인식 결 과 (%) 


정규화 센 트 랄 모 우 먼 트 (00700811260 000081 000- 
006014) 는 제안한 방 법 과 동 일 하게 문 자 영 상 의 크기, 
위치, 획 의 폭 을 정규화 하지 않고 특 징 을 추 출 하 는 
방 법 이 다. 따라서 제 안 된 방 법 과 인식 성 능 과 속 도 를 
비 교 하고자, 정규화 센 트 랄 모 우 먼 트 를 이 용 하 여 비 
교 인식 실 험 을 하였다. 제 ※ 1 크 기 의 문자 영 상 이 
불연속 함수 7(7,7) 로 표 시 되면, 차 수 가 (0,0) 인 2 차 
원 모 우 먼 트 (02001000 는 


가노 
= 어 함 70900, 


로 나 타 내 어 진 다. 또한 센 트 랄 모 우 먼 트 (660 ㅁ 81 0 ㅁ 0- 


ㆍ , ㅇ 8 
1006200 는 2. 7210/000. 70 0017%0@ 인 경우, 


= 점 힘 0-701 0-70906.0 


의 0=0,1.09, 22202 , 
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로 표 시 된 다 위 의 식 으로 구 해 진 센 트 랄 모 우 먼트 
는 영 상 의 위치 변 화 에 무 관 하게 된다. 영 상 의 크 
기에 독 립 적 인 정규화 센 트 랄 모 우 먼 트 (0007081260 
66068! 00007600 는 2, = /,,/ /6@' 로 주어진다. 여기 
서 7=(2+ ㅜ 0)/2+2 이 다 [161. 

이 실 험 에서는 영 상 의 작은 변 화 에 덜 민감한 8 개 
의 낮은 차 수 의 정규화 센 트 랄 모 우 먼 트 를 특 징 으 로 
이 용 하 였다. 제 안 된 방 법 과 정규화 센 트 랄 모 우 먼트 
에 의한 인식 결 과 를 표 3 에 보였다. 표 3 에 서 정규화 
센 트 랄 모 우 먼 트 를 이용한 인식 결 과 가 제 안 된 방법 
에 비해 높은 인 식 오 류 율 인 5.03% 를 보여, 제 안 된 
방 법 이 인식 성능 면 에 서 효 과 적 임을 나타냈다. 문자 
형 상 에서 특 징 을 구 하 는 데 요 구 되 는 시간적 복잡도 
를 비 교 하고자, 제안한 방 법 에 소 요 되는 시 간 과 정규 
화 센 트 랄 모 우 먼 트 를 구 하 는 데 소 요 되 는 시 간 을 20 
60040 270 200 에 서 실 행 하여 표 3 에 보였다. 제안 
된 방 법 은 등분 분 할 의 수 에 무 관 하 게 일정한 시 간 이 
소 요 됨 을 알 수 있다. 이러한 결 과 는 제 안 된 방 법 이 
등분 분 할 의 수 와 관 계 없 이 영 상 을 한 번만 주 사 하여 
완 료 되는데 기 인 한 다. 반 면 에 적은 수 의 특 징 인 8 개 
의 정규화 센 트 랄 모 우 먼 트 를 구 하 는 데 소 요 된 시간 
은 제 안 된 방 법 보다 약 3 배 이상의 시 간 이 필 요 함 을 
보여 제 안 된 방 법 이 소요 시간 면 에 서 보다 효 율 적 임 
을 보였다. 


표 3. 제 안 된 방 법 과 정규화 센 트 랄 모 우 먼 트 의 인식 비교 


인 식 오 류 률 | 평 균 오 류 률 | 소 요 시 간 


(%) (96) (00560) 


10.21 0.84 7.53 


특징 추출 방법 
제 안 방법 


(2 동 분 분할) 


문자 인 식 에 있어서 일 반 적 으로 가장 많이 사 용 하 
는 방 법 은 위 치 와 크 기 의 변 화 를 먼저 정 규 화 한 후 
세 선 화 에 의해 골격 영 상 을 구성한 다 옴에 특 징 을 
구하는 것이다. 이에 따라 필기체 문자 집 단 에 대해 
다 음 과 같은 비교 실 험 을 하였다. 첫 번 째 는 위 치 와 


크 기 가 정 규 화 되지 않은 영 상 에서 세 선 화 한 골 격 의 
망 특 징 을 구 하 였다. 두 번 째 는 위 치 와 크 기 를 정규 
화한 후 세 선 화 한 골 격 에서 망 특 징 올 구 하 였다. 세 
번 째 로 는 두 번 째 의 상 태 에서 방향 마 스 크 를 적용한 
후 망 특 징 을 구 하 였다. 이상의 3 가 지 특 징 에 의한 
인식 결 과 를 표 4 에 요 약 하였다. 문자 영 상 의 세 선화 
알 고 리 즘 으 로 는 보 편 적 으로 많이 이 용 되고 있는 
가 1308 과 5460 이 제안한 알 고 리 즘 을 사 용 하였다. 


표 4. 제 안 된 방 법 과 정규화, 세 선화 방 법 의 인식 비교 


인 식 오 류 률 


특 추 충 방 
특징 주 줄 강 법 (%) 


제 안 방 법 
(3 동 분 분할) 


세 선 화 + 망 특징 


위 치 , 크 기 정 규 화 
+ 세 선 화 + 
망 특징 

위 치 , 크 기 정 규 화 

+ 세 선 화 + 방 향 

마 스 크 + 망 특징 


먼저 첫 번째 방 법 은 예 상 대 로 매우 나쁜 인식 결 
과로 나타났다. 이는 위 치 와 크 기 의 정 규 화 가 망 특 
징 에 필 수 적 임을 보여준다. 두 번째 방 법 은 위치, 크 
기 의 정 규 화 와 세 선화 후에 10 ※ 10 크 기 로 압 축 한 
망 특 징 을 사용한 경 우 로서 인 식 오 류 률 이 7.21% 로 
나타났다. 세 번째 방 법 에 서는 4 방 향 성 분 의 망 특징 
을 사 용 함 에 따라 특징 벡 터 의 크 기 가 두 번째 방법 
에 비해 4 배 로 증 가 했다. 그럼에도 불 구 하고 인식 성 
농 은 큰 차 이 가 없게 나타났다. 3 가 지 방법 모두 제안 
된 방 법 에 비해 인식 성 능 이 떨 어 짐 을 보였다. 이는 
원 영 상 에 정 규 화 나 세 선 화 를 적 용 할 경우 원 영 상의 
정 보 가 유 실 되 거나 왜 곡 될 수 있으며, 결 과 적 으로 인 
식 에 부정적인 영 향 을 줄 수 있 음 에 그 원 인 이 있다 
고 판 단 된다. 특허 잡 음 이 많은 영 상 에 세 선화 알고 
리 즘 을 적 용 할 경 우 에 이러한 현 상 이 발생할 가능성 
이 증 가 한 다. 특징 추 출 에 소 요 되는 시 간 은 정 규 화 와 
세 선 화 를 적 용 하 는 방 법 이 제 안 된 방 법 보다 2.5 배 내 
지 3 배 정도 더 소 요 되 는 것으로 나타났다. 필기체 문 
자 인식 실 험 에 사 용 된 문자 영상 중에서 오 인 식 올 
유 발 한 영 상 의 예 를 제 안 된 방법, 정규화 센 트 랄 모 우 


먼트 방법, 위치, 크기 정규화 후 세 선 화 , 망 특징 방 
법 의 경 우 로 구 분 하여 그림 10 에 보였다. 
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그림 10. 필기체 문자 중 오 인 식 된 영상 


(8) 제 안 된 방 법 , (6) 정 규 화 센 트 랄 모 우 먼트, 
(6) 위 치 , 크 기 정 규 화 + 세 선 화 + 망 특징 


음 으 로 는 001 카 메 라 로 자동차 번호판 영 상 을 
입 력 한 후, 번호판 영 상 에서 큰 숫 자 를 분 할 한 영상 
에 대한 인식 실 험 을 수 행 하였다. 이때 영 상 의 크기 
는 30 ※ 60 이 고, 총 516 개 의 영상 중에서 비교적 상태 
가 양호한 250 개 의 영 상 울 이용해 신 경 희 로 망 을 학 
습 시켰다. 나머지 266 개 의 영 상 은 테스트 패 턴 으로 
사 용 하였다. 제 안 된 방 법 은 수 직 축 을 6 등 분, 수 평 축 
을 3 등 분 하 여 36 차 원 특 징 벡 터 를 구 성 하 였다. 비교 
방 법 으 로 위 치 와 크기 정규화, 세 선화, 방 향 마스크, 
망 특 징 에 의해 72 차 원 특 징 벡 터 를 구 성 하 였다. 표 
5 에 두 가지 방 법 에 의한 인식 결 과 를 비 교 하였다. 
학습 패 턴 에 대해 두 방법 모두 완 전 하 게 인 식 하 였 으 
나, 테스트 패 턴 의 인 식 에서는 제 안 된 방 법 이 약 49 
정도 향상된 인 식 률 을 보였다. 두가지 방 법 에 의한 


표 5. 자동차 번호판 숫자 인식 결과 


학 습 데 이 터 | 테 스 트 데이터 
짐 추출 방범 | 빅 터 | 인 식 오 류 를 | 인 삭 오 류 찰 
(96) (96) 


0 


제 안 방법 


36 | _0.00 0.93 
(6,3 등 분 분 할) 
[ 
위 치 , 크 기 정 규 화 + 
세 선 화 + 방 향 72 | 000 13.16 


마 스 크 + 망 특징 
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자동차 번호 인식 실 험 의 경우 인 식 에 실 패 하는 영상 
들은 그럼 11 과 같다. 
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그림 11. 자동차 번호 중 오 인 식 된 영상 


(8) 제 안 된 방법, 
(6) 위 치 , 크 기 정 규 화 + 세 선 화 + 망 특징 


다층 퍼 셉 트 론 은 일반화 특 성 의 장 점 이 있는 반면 
에 복잡한 사 상 을 요 구 하 는 문자 인 식 에서 극 소 해 
귀착 가 능 성 이 커질 수 있다. 국 소 적 학습 방 식 의 다 
총 퍼 셉 트 론 의 극 소 해 가 능 성 을 줄 이 고 자, 전 역 적 최 
적 화 를 수 행 하는 유전자 알 고 리 즘 을 이용해 가중치 
를 초 기 화 하 였 다 [17,181. 가중치 초기화 방 법 은 가중 
치를 병 립 시킨 스 트 령 을 구 성 하 여 하 나 의 개 체 로 정 
의하여, 개 체 의 적 합 도 를 패턴 집 단 에 대해 순방향 
전 파 를 수 행 한 평균 출력 오 류 값 으로 하였다. 인식 
실험 결과 유전자 알 고 리 즘 으로 초 기 화 된 가 중 치 에 
의한 학 습 은 무작위 가중치 할 당 의 경 우 보다 수 렴 에 
필요한 반복 횟 수 는 줄 어 들 었으나, 초 기 화 하는데 보 
다 많은 시 간 이 소 요 되 므로 학습 시간 측 면 에 서 유리 
하다고 하 기 는 어려웠다. 그러나 최 적 화 된 초기 상태 
로 부 터 의 학 습 은 극 소 해 에 귀 착 하 는 가 능 성 을 줄일 
수 있으므로 시 행 착 오 적 인 반복 실험 횟 수 를 줄이는 


데 도 움 이 되었다. 


5. 결 론 


문자 인 식 을 위한 신 경 희 로 망 의 학 습 은 고속 
터 나 병렬, 분산 컴퓨팅 환 경 에서 장시간 오프라인 
로 학 습 시킬 수 있으므로 시간적 제 약 이 완 화 될 수 
있다. 그러나 인 식 에 필요한 문자 영 상 의 전 처 리 는 


> 10 쾌 
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실시간 온 라 인 으로 실 행 되므로, 인 식 에 적합한 특징 
을 신 속 하게 추 출 해 야 한다. 잡 음 을 포 함 하거나 작은 
문자 영 상 에 대한 기하학적 정 규 화 나 세 선화 변 환 은 
원 영 상의 정 보 를 유 실 하거나 왜 곡 하여 인 식 에 부정 
적인 효 과 를 줄 수 있다. 특히 세 선 화 는 잡 음 이나 세 
부 형 태 의 변 화 에 매우 민 감 하 므로, 세 선 화 된 콜 격 이 
문자 영 상 의 원 형 을 적절히 유 지 하지 못할 경우 인식 
에 부정적인 결 과 를 줄 수 있다. 

이예 따라 본 연 구 는 오프라인 문 자 인 식 시 스 템 의 
구 현 에 있어, 문자 영 상 의 인 식 에 필요한 효과적인 
특 징 을 신 속 하게 원 영 상에서 직접 구 하 고 자 하였다. 
문자 영 상 의 주요 특 징 을 구하기 위한 방 법 으로 획 을 
구 성 하는 화소 중에서 인 식 의 관 점 에서 의미 있는 
화 소 를 윤 곽 화 소 로 정 의 하고, 이러한 윤 곽 화 소 에 한 
하여 선 택 적 으로 방향 성 분 을 구 하 고 자 하였다. 윤곽 
화 소 에 마스크 연 산 을 적용한 방향 성 분 을 영상 축 에 
투 영 하였으며, 투 영 된 구 간 을 최적 균등 분 할 하여 서 
로 사 상 되는 구 간 에 대한 투 영 값 의 비 를 특 징 으로 
사 용 하였다. 문자 영 상 의 위치, 크기, 획 의 폭 변 화 를 
원 영 상의 변환 없이 수 용 하므로 인 식 에 효과적인 특 
징 을 구할 수 있었으며, 한 번의 영상 주 사 로 모든 
과 정 이 이 루 어 지 게 함으로써 전 처 리 에 소 요 되는 시 
간 을 줄일 수 있었다. 

자 모 음 인식 실 험 예서 정규화 센 트 랄 모 우 먼트 방 
법과 위치, 크기 정규화 후 세 선 화 한 방 법 은 각각 인 
식 오 류 율 5.03% 와 7.21% 를 보인 반 면 에, 제 안 된 방 
법 은 인 식 오 류 을 2.84% 를 나타내 인 식 에 보다 효과 
적 임 을 보 였 으 며 , 실 행 시간 면 에 서는 제 안 된 방 법 이 
3 배 정도 효 율 적 이었다. 자동차 번호 인 식 의 경 우 에 
서도 제 안 된 방 법 이 정규화 후 세 선화 방 법 보다 4 
정도 우수한 인 식 률 을 보였다. 이러한 인식 성 능 의 
차 이 는 크 기 가 작고 잡 음 이 많은 문자 영 상 을 정규화 
하고 세 선 화 하 는 영상 변 환 이 인 식 에 부 정 적 으로 작 
용 할 수 있 음 에 반하여, 제 안 된 방 법 은 영상 변환 없 
이 직접 원 영 상 으 로 부 터 효과적인 특 징 을 구 하 는 데 
기 인 한다고 판 단 된다. 또한 제 안 된 방 법 은 간단한 마 
스크 연 산 과 한 번 의 화상 주 사 로 특징 추 출 이 완 료 되 
므로 인식 속도 면 에 서 유 리 하였다. 제 안 된 방 법 이 
인 식 에 효과적인 특 징 을 신 속 하게 구할 수 있으므로 
산업 현 장 의 실시간 문자 입력 자 동 화 에 도 움 이 되리 
라 기 대 한다. 
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